1. Identificação | |
Tipo de Referência | Tese ou Dissertação (Thesis) |
Site | mtc-m21c.sid.inpe.br |
Código do Detentor | isadg {BR SPINPE} ibi 8JMKD3MGPCW/3DT298S |
Identificador | 8JMKD3MGP3W34R/4257LEL |
Repositório | sid.inpe.br/mtc-m21c/2020/03.09.19.33 |
Última Atualização | 2020:08.10.15.02.48 (UTC) simone |
Repositório de Metadados | sid.inpe.br/mtc-m21c/2020/03.09.19.33.23 |
Última Atualização dos Metadados | 2020:08.13.04.13.47 (UTC) administrator |
Chave Secundária | INPE-18297-TDI/2973 |
Chave de Citação | Barchi:2020:MaDeLe |
Título | Machine and deep learning applied to galaxy morphology |
Título Alternativo | Aprendizado de máquina tradicional e profundo aplicado a morfologia de galáxias |
Curso | CAP-COMP-SESPG-INPE-MCTIC-GOV-BR |
Ano | 2020 |
Data | 2020-03-09 |
Data de Acesso | 06 maio 2024 |
Tipo da Tese | Tese (Doutorado em Computação Aplicada) |
Tipo Secundário | TDI |
Número de Páginas | 83 |
Número de Arquivos | 1 |
Tamanho | 9586 KiB |
|
2. Contextualização | |
Autor | Barchi, Paulo Henrique |
Banca | Queiroz, Gilberto Ribeiro de (presidente) Rosa, Reinaldo Roberto (orientador) Carvalho, Reinaldo Ramos de (orientador) Körting, Thales Sehn Menéndez-Delmestre, Karín Oliveira Filho, Irapuan Rodrigues de |
Endereço de e-Mail | paulobarchi@gmail.com |
Universidade | Instituto Nacional de Pesquisas Espaciais (INPE) |
Cidade | São José dos Campos |
Histórico (UTC) | 2020-03-09 19:36:25 :: paulobarchi@gmail.com -> pubtc@inpe.br :: 2020-03-10 16:50:39 :: pubtc@inpe.br -> paulobarchi@gmail.com :: 2020-04-22 15:42:29 :: paulobarchi@gmail.com -> pubtc@inpe.br :: 2020-04-24 11:26:14 :: pubtc@inpe.br -> paulobarchi@gmail.com :: 2020-04-28 15:30:17 :: paulobarchi@gmail.com -> administrator :: 2020-08-10 14:45:22 :: administrator -> pubtc@inpe.br :: 2020-08-11 20:29:59 :: pubtc@inpe.br -> simone :: 2020-08-11 20:34:00 :: simone :: -> 2020 2020-08-12 17:30:39 :: simone -> administrator :: 2020 2020-08-13 04:13:47 :: administrator -> :: 2020 |
|
3. Conteúdo e estrutura | |
É a matriz ou uma cópia? | é a matriz |
Estágio do Conteúdo | concluido |
Transferível | 1 |
Palavras-Chave | computational astrophysics galaxy morphology machine learning deep learning astrofísica computacional morfologia de galáxias aprendizado de máquina aprendizado de máquina profundo |
Resumo | Morphological classification is a key piece of information to define samples of galaxies aiming to study the large-scale structure of the universe. In essence, the challenge is to build up a robust methodology to perform a reliable morphological estimate from galaxy images. Here, I investigate how to substantially improve the galaxy classification within large datasets by mimicking human classification. I combine accurate visual classifications from the Galaxy Zoo project with machine and deep learning methodologies. I propose two distinct approaches for galaxy morphology: one based on non-parametric morphology and traditional machine learning algorithms; and another based on deep learning. To measure the input features for the traditional machine learning methodology, I and my collaborators have developed a system called CyMorph, with a novel non-parametric approach to study galaxy morphology. The main datasets employed comes from the Sloan Digital Sky Survey Data Release 7 (SDSS-DR7). I also discuss the class imbalance problem considering three classes. Performance of each model is mainly measured by overall accuracy (OA). A spectroscopic validation with astrophysical parameters is also provided for Decision Tree models to assess the quality of our morphological classification. In all of our samples, both Deep and Traditional Machine Learning approaches have over 94.5% OA to classify galaxies in two classes (elliptical and spiral). I compare our classification with state-of-the-art morphological classification from literature. Considering only two classes separation, I achieve 99% OA in average when using our deep learning models, and 82% when using three classes. I provide a catalog with 670,560 galaxies containing our best results, including morphological metrics and classification. RESUMO: Classificação morfológica é peça chave de informação para definir amostras de galáxias com objetivo de estudar a estrutura do Universo em larga-escala. Em essência, o desafio é construir uma metodologia robusta para produzir uma estimativa morfológica confiável a partir de imagens de galáxias. Aqui, investigo como melhorar substancialmente a classificação automática de galáxias em grandes conjuntos de dados ao imitar a classificação fornecida por humanos. Combino classificações visuais do projeto Galaxy Zoo com metodologias de aprendizado de máquina tradicional e profundo. Proponho duas abordagens distintas para morfologias de galáxias: uma baseada em morfologia não-paramétrica e algoritmos de aprendizado de máquina tradicional; e outra baseada em aprendizado profundo. Para medir as características morfológicas de entrada para algoritmos de aprendizado de máquina tradicional, desenvolvi com meus colaboradores um sistema chamado CyMorph, com uma nova abordagem não-paramétrica para estudar morfologia de galáxias. O principal conjunto de dados explorado provém do Sloan Digital Sky Survey Data Release 7 (SDSS-DR7). Também discuto o problema de desbalanceamento de classes considerando o problema com três classes. A performance de cada modelo é medida principalmente por acurácia global. A validação espectroscópica com parâmetros astrofísicos também é fornecida para os modelos de Árvore de Decisão para avaliar a qualidade de nossa classificação morfológica. Em todas as nossas amostras, tanto com aprendizado de máquina profundo como tradicional, obtenho mais de 94.5% de acurácia global para classificar galáxias em duas classes (elíptica e espiral). Comparo minha classificação com classificações morfológicas do estado-da-arte da literatura. Considerando apenas duas classes, atingi 99% de acurácia global e média usando modelos de aprendizado profundo, e 82% usando três classes. Forneço uma catálogo com 670.560 galáxias contendo nossos melhores resultados, incluindo métricas morfológicas e classificações. |
Área | COMP |
Arranjo | urlib.net > Produção pgr ATUAIS > CAP > Machine and deep... |
Conteúdo da Pasta doc | acessar |
Conteúdo da Pasta source | originais/@4primeirasPaginas.pdf | 07/08/2020 20:33 | 411.2 KiB | originais/aprovacao.pdf | 12/08/2020 08:28 | 833.1 KiB | originais/BarchiPH_Thesis-1.pdf | 28/04/2020 14:33 | 7.9 MiB | |
Conteúdo da Pasta agreement | |
|
4. Condições de acesso e uso | |
URL dos dados | http://mtc-m21c.sid.inpe.br/ibi/8JMKD3MGP3W34R/4257LEL |
URL dos dados zipados | http://mtc-m21c.sid.inpe.br/zip/8JMKD3MGP3W34R/4257LEL |
Idioma | en |
Arquivo Alvo | publicacao.pdf |
Grupo de Usuários | paulobarchi@gmail.com pubtc@inpe.br simone |
Visibilidade | shown |
Licença de Direitos Autorais | urlib.net/www/2012/11.12.15.10 |
Detentor dos Direitos | originalauthor yes |
Permissão de Leitura | allow from all |
Permissão de Atualização | não transferida |
|
5. Fontes relacionadas | |
Repositório Espelho | urlib.net/www/2017/11.22.19.04.03 |
Unidades Imediatamente Superiores | 8JMKD3MGPCW/3F2PHGS |
Lista de Itens Citando | sid.inpe.br/bibdigital/2013/10.12.22.16 1 |
Acervo Hospedeiro | urlib.net/www/2017/11.22.19.04 |
|
6. Notas | |
Campos Vazios | academicdepartment affiliation archivingpolicy archivist callnumber contenttype copyholder creatorhistory descriptionlevel dissemination doi electronicmailaddress format group isbn issn label lineage mark nextedition notes number orcid parameterlist parentrepositories previousedition previouslowerunit progress readergroup resumeid schedulinginformation secondarydate secondarymark session shorttitle sponsor subject tertiarymark tertiarytype url versiontype |
|